智能论文笔记

Comparative Analysis of Time Series Forecasting Approaches for Household Electricity Consumption Prediction

Muhammad Bilal , Hyeok Kim , Muhammad Fayaz , Pravin Pawar

分类：机器学习

2022-07-03

由于人口和全球化的增加，对能源的需求大大增加。因此，准确的能源消耗预测已成为政府规划，减少能源浪费和能源管理系统稳定运行的基本先决条件。在这项工作中，我们介绍了对家庭能耗的时间序列预测的主要机器学习模型的比较分析。具体来说，我们使用WEKA（一种数据挖掘工具）首先将模型应用于Kaggle数据科学界可获得的小时和每日家庭能源消耗数据集。应用的模型是：多层感知器，K最近的邻居回归，支持向量回归，线性回归和高斯过程。其次，我们还在Python实施了时间序列预测模型Arima和Var，以预测有或没有天气数据的韩国家庭能源消耗。我们的结果表明，预测能源消耗预测的最佳方法是支持向量回归，然后是多层感知器和高斯过程回归。

translated by 谷歌翻译

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

Understanding BLOOM: An empirical study on diverse NLP tasks

Parag Pravin Dakle , SaiKrishna Rallabandi , Preethi Raghavan

分类：自然语言处理

2022-11-27

In this work, we present an evaluation of smaller BLOOM model variants (350m/560m and 1b3/1b7) on various natural language processing tasks. This includes GLUE - language understanding, prompt-based zero-shot and few-shot text classification and extraction, question answering, prompt-based text generation, and multi-lingual text classification to understand model strengths/weaknesses and behavior. Empirical results show that BLOOM variants under-perform on all GLUE tasks (except WNLI), question-answering, and text generation. The variants bloom for WNLI, with an accuracy of 56.3%, and for prompt-based few-shot text extraction on MIT Movies and ATIS datasets. The BLOOM variants on average have 7% greater accuracy over GPT-2 and GPT-Neo models on Director and Airline Name extraction from MIT Movies and ATIS datasets, respectively.

translated by 谷歌翻译

Prospects of federated machine learning in fluid dynamics

Omer San , Suraj Pawar , Adil Rasheed

分类：机器学习

2022-08-15

基于物理学的模型已成为流体动力学的主流，用于开发预测模型。近年来，由于数据科学，处理单元，基于神经网络的技术和传感器适应性的快速发展，机器学习为流体社区提供了复兴。到目前为止，在流体动力学中的许多应用中，机器学习方法主要集中在标准过程上，该过程需要将培训数据集中在指定机器或数据中心上。在这封信中，我们提出了一种联合机器学习方法，该方法使本地化客户能够协作学习一个汇总和共享的预测模型，同时将所有培训数据保留在每个边缘设备上。我们证明了这种分散学习方法的可行性和前景，并努力为重建时空领域建立深度学习的替代模型。我们的结果表明，联合机器学习可能是设计与流体动力学相关的高度准确预测分散的数字双胞胎的可行工具。

translated by 谷歌翻译

Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning

Jerin Paul Selvan , Pravin S. Game

分类：机器学习 | 人工智能

2022-07-28

十多年来，机器人技术和人造代理的使用已成为普遍的事物。测试新路径查找或搜索空间优化算法的性能也已成为挑战，因为它们需要模拟或环境来测试它们。具有人造代理的人工环境是测试这种算法的方法之一。游戏也已成为测试它们的环境。可以通过使用将根据环境中的算法来比较这些算法的性能提出。性能参数可以是，代理商能够在奖励行动和敌对行动之间区分多快。可以通过将代理放置在具有不同类型障碍的环境中，而代理的目标是达到最远的通过决定将避免所有障碍的行动做出决定。选择的环境是一种称为“脆弱鸟”的游戏。 E游戏是要使鸟飞过一组随机高度的管道。鸟必须在这些管道之间进行，并且不能击中顶部，底部或管道本身。在人造药物上强制执行的算法是增强拓扑的神经进化（整洁）和增强学习的算法。整洁的算法采用人工的初始群体，这些算法遵循遗传算法，请遵循“ n n”初始算法。一个目标功能，交叉，突变和增强拓扑结构。另一方面，提升方形学习记得状态，在该状态下采取的行动以及使用单个代理和深层学习网络采取的行动获得的奖励随着人造药物的初始种群的增加，整洁算法的性能不断提高。

translated by 谷歌翻译

Multi-head Cascaded Swin Transformers with Attention to k-space Sampling Pattern for Accelerated MRI Reconstruction

Mevan Ekanayake , Kamlesh Pawar , Mehrtash Harandi , Gary Egan , Zhaolin Chen

分类：人工智能 | 计算机视觉 | 机器学习

2022-07-18

由于组织和骨骼之间的相似性，在人解剖结构中广泛看到了全球相关性。由于近距离质子密度和T1/T2参数，这些相关性反映在磁共振成像（MRI）扫描中。此外，为了实现加速的MRI，k空间数据的采样不足，从而导致全球混叠伪像。卷积神经网络（CNN）模型被广泛用于加速MRI重建，但是由于卷积操作的固有位置，这些模型在捕获全球相关性方面受到限制。基于自发的变压器模型能够捕获图像特征之间的全局相关性，但是，变压器模型对MRI重建的当前贡献是微小的。现有的贡献主要提供CNN转换器混合解决方案，并且很少利用MRI的物理学。在本文中，我们提出了一种基于物理的独立（无卷积）变压器模型，标题为“多头级联SWIN变压器（MCSTRA），用于加速MRI重建。 MCSTRA将几种相互关联的MRI物理相关概念与变压器网络相结合：它通过移动的窗口自我发场机制利用了全局MR特征；它使用多头设置分别提取属于不同光谱组件的MR特征；它通过级联的网络在中间脱氧和K空间校正之间进行迭代，该网络具有K空间和中间损耗计算中的数据一致性；此外，我们提出了一种新型的位置嵌入生成机制，以使用对应于底面采样掩码的点扩散函数来指导自我发作。我们的模型在视觉上和定量上都大大优于最先进的MRI重建方法，同时描述了改善的分辨率和去除词法。

translated by 谷歌翻译

Analyzing the impact of SARS-CoV-2 variants on respiratory sound signals

Debarpan Bhattacharya , Debottam Dutta , Neeraj Kumar Sharma , Srikanth Raj Chetupalli , Pravin Mote , Sriram Ganapathy , Chandrakiran C , Sahiti Nori , Suhail K K , Sadhana Gonuguntla

分类：机器学习

2022-06-24

COVID-19导致与不同的SARS-COV-2变体相关的多种感染波。研究报告了这些变体对患者呼吸健康的影响不同。我们探索从COVID-19受试者收集的声学信号是否显示出可区分的声学模式，这表明有可能预测潜在的病毒变体。我们分析了从三个主题库中收集的COSWARA数据集，即i）健康，ii）在三角洲变体占主导地位期间记录的covid-199受试者，以及III）来自Omicron Expear中记录的COVID-19的数据。我们的发现表明，咳嗽，呼吸和语音等多种声音类别表明，在将COVID-19与Omicron和Delta变体进行比较时，声音特征差异很大。在曲线下，分类区域大大超过了被Omicron感染的受试者与三角洲感染者的机会。使用来自多个声音类别的得分融合，我们在95％的特异性下获得了89％和52.4％的敏感性的区域。此外，使用分层三类方法将声学数据分类为健康和共同-19阳性，并将进一步的COVID受试者分为三角洲和Omicron变体，从而提供了高水平的3类分类精度。这些结果提出了设计基于声音的COVID-19诊断方法的新方法。

translated by 谷歌翻译

Coswara: A website application enabling COVID-19 screening by analysing respiratory sound samples and health symptoms

Debarpan Bhattacharya , Debottam Dutta , Neeraj Kumar Sharma , Srikanth Raj Chetupalli , Pravin Mote , Sriram Ganapathy , Chandrakiran C , Sahiti Nori , Suhail K K , Sadhana Gonuguntla

分类：机器学习

2022-06-09

COVID-19大流行已经加快了关于替代，快速有效的Covid-19诊断方法设计的研究。在本文中，我们描述了Coswara工具，这是一个网站应用程序，旨在通过分析呼吸声样本和健康症状来启用COVID-19检测。使用此服务的用户可以使用连接到Internet的任何设备登录到网站，提供当前的健康症状信息，并记录很少有对应于呼吸，咳嗽和语音的声音。在分析此信息上的一分钟内，网站工具将向用户输出COVID-19概率分数。随着COVID-19的大流行继续要求进行大规模和可扩展的人口水平测试，我们假设所提出的工具为此提供了潜在的解决方案。

translated by 谷歌翻译

Third-Party Hardware IP Assurance against Trojans through Supervised Learning and Post-processing

Pravin Gaikwad , Jonathan Cruz , Prabuddha Chakraborty , Swarup Bhunia , Tamzidul Hoque

分类：机器学习

2021-11-29

片上系统（SoC）开发人员越来越依赖于从不受信任的第三方供应商获得的预先验证的硬件知识产权（IP）块。这些IP可能包含隐藏的恶意功能或硬件特洛伊木马，以损害制造的SOC的安全性。最近，监督机器学习（ML）技术在第三方IPS（3PIPS）中识别潜在特洛伊木马网的蚊帐具有有前途的能力。但是，他们带来了几项重大挑战。首先，他们并没有引导我们最佳选择可靠地涵盖各种特洛伊木马的特点。其次，它们需要多个无特洛伊木马/可信设计来插入已知的特洛伊木马并生成培训的模型。即使一系列可靠的设计可用于培训，嫌疑IP也可能与该集合的可信设计截然不同，这可能会对验证结果产生负面影响。第三，这些技术仅识别一套需要手动干预以了解潜在威胁的嫌疑人的特洛伊木网。在本文中，我们提供了VIPR，一个系统的机器学习（ML）基于3PP的信任验证解决方案，用于消除对培训的可信设计的需求。我们介绍了一个全面的框架，相关算法，以及用于获得最佳特征的刀具流，培训目标机器学习模型，检测嫌疑网，并从嫌疑网识别特洛伊木马电路。我们评估了几种信任集线器特洛伊木马基准测试的框架，并在不同培训的型号，选择功能和后处理技术方面提供了对检测性能的比较分析。所提出的后处理算法将误报可降低至92.85％。

translated by 谷歌翻译

Scalable Machine Learning Architecture for Neonatal Seizure Detection on Ultra-Edge Devices

Vishal Nagarajan , Ashwini Muralidharan , Deekshitha Sriraman , Pravin Kumar S

分类：机器学习

2021-11-29

新生儿癫痫发作是一种通常遇到的神经系统条件。它们是严重神经障碍的第一个临床迹象。因此，需要快速识别和治疗以防止严重的死亡。在神经学领域中使用脑电图（EEG）允许精确地诊断几种医疗条件。然而，解释EEG信号需要高度专业人员的注意，因为婴儿脑在新生儿期间发育不起。检测癫痫发作可能会妨碍对婴儿的神经认知发展的负面影响。近年来，使用机器学习算法的新生儿癫痫发作检测已经获得牵引力。由于需要在癫痫发作检测的情况下对生物信号进行计算廉价的生物信号，因此本研究提供了一种基于机器学习（ML）的架构，其与以前的模型相当的预测性能，但具有最小级别配置。拟议的分类器在赫尔辛基大学医院录制的尼古尔缉获量的公共数据数据上进行了培训和测试。我们的架构实现了87％的最佳敏感性，比本研究中选择的标准ML型号的6％增加了6％。 ML分类器的模型大小优化为仅为4.84 kB，最小预测时间为182.61毫秒，从而使其部署在可穿戴的超边设备上，以便快速准确，并避免基于云的需求和其他这种穷举计算方法。

translated by 谷歌翻译